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Нейросетевой алгоритм планирования 
траекторий для группы мобильных роботов” 


Рассматриваются вопросы построения интеллектуальной системы планирования траекторий движения 
для группы мобильных роботов на базе рекуррентной нейронной сети. Планирование реализовано по 
гибридному принципу и заключается в построении общего блока конструктора пути для формирования 
траекторий участников группы в рабочем пространстве и использовании распределенной рекуррентной 
нейронной сети для формирования нейронной карты с учетом целевых позиций каждого из мобильных 
роботов. 


Введение 


Для управления движением мобильных роботов, функционирующих в условиях 
неопределенности, в последние годы широкое распространение получили методы ре- 
шения на основе интеллектуальных алгоритмов: нейронных сетей (НС), генетических 
алгоритмов и нечеткой логики [1], [2]. В данной работе будет рассмотрена методика 
синтеза интеллектуального (адаптивного) управления движением мультиагентных сис- 
тем в условиях неопределённости на основе нелинейных технологий управления, реа- 
лизуемых в нейросетевом базисе. 

Предложенный подход является развитием рассмотренной в предыдущей рабо- 
те авторов методики использования нейронной карты для планирования траектории 
мобильного робота [3]. Первый вариант системы позиционирования мобильного ро- 
бота основан на одновременной работе трех подсистем: нейронной сети, генератора 
траектории и регулятора скорости (рис. 1). Для простейшего случая, когда планирова- 
ние траектории проводится для одного мобильного робота в стационарном рабочем 
пространстве, отсутствие динамических препятствий снимает необходимость плани- 
рования с учетом скорости перемещения, поэтому архитектура системы может быть 
упрощена: работают только нейронная карта и генератор траектории. Введем следую- 
щие обозначения: В — мобильный робот, С — заданное рабочее пространство. Некоторый 
внешний источник (сенсорная система) непрерывно обеспечивает систему планирова- 
ния информацией Х об окружающей среде. По получаемой информации определяются 
конфигурация заданного пространства С и расположение препятствий. Следует отме- 
тить, что определение точной конфигурации рабочего пространства во многом зависит 
от технических возможностей внешнего источника (сенсорной системы). Сенсорная 
информация Х с помощью энергетических взаимодействий нейронов в сети отобра- 
жается в виде нейронной карты Ч на нейронной области Е. 


" Результаты, представленные в данной статье, получены в рамках работ по проекту Программы №15 
ОЭММПУ РАН и грантов РФФИ 08-08-9702 1-р_поволжье а, 08-08-97039-р_поволжье а, 10-08-00567-а. 
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Рисунок 1 — Архитектура системы планирования 


Основная идея предлагаемого подхода состоит в том, чтобы использовать ней- 
ронную карту как динамическое представление заданного пространства, информация 
о которой поступает с внешних источников. Энергетические взаимодействия нейро- 
нов в сети подобно распространению волны возмущений приводят к возникновению 
так называемого ландшафта активации, который используется в дальнейшем как нави- 
гационная карта для планирования траектории. 

Координаты цели, а также информация об окружающей среде поступают на вход 
аналоговой нейронной сети Хопфилда (рис. 2), которая представляет собой слой адап- 
тивных сумматоров с обратными связями, выходные сигналы которых, подвергаясь 
нелинейной обработке по заданному закону, поступают с некоторой временной за- 
держкой на входы нейронов, в результате чего выходной сигнал нейронной сети фор- 
мируется лишь после того, как сеть достигнет динамического равновесия [4]. 


Рисунок 2 — Архитектура рекуррентной сети Хопфилда 


Нейроны сети входят в состояние равновесия и принимают собственные значе- 
ния энергии (в зависимости от функции активации). Взаимодействия нейронов постро- 
енной сети обусловлены динамикой и архитектурой самой сети, а также конфигурацией 
окружающего пространства и координатами цели, которая является точкой активации. 
Значения энергии нейронов на данной нейронной области (ландшафт активации) по- 
ступают на вход блока генератора траектории, который, в свою очередь, выполняет 
расчет траектории по данным значениям. 
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Применение метода планирования 
для группы мобильных роботов 


Для малых групп мобильных роботов систему предлагается реализовать по гиб- 
ридному принципу: строится общий блок конструктора пути, который последовательно 
пошагово формирует траектории участников группы в общем рабочем пространстве, 
и распределенная НС (каждый участник группы оснащен НС) формирует нейронную 
карту с учетом собственной целевой позиции. Для эффективного управления движением 
мультиагентных систем была проведена модернизация всего алгоритма функциониро- 
вания системы планирования, а именно: 

1. Для увеличения производительности системы изменено условие сходимости 
сети: сеть считается достигшей состояния равновесия, если все активные нейроны (то 
есть все нейроны, кроме препятствий) имеют значения отличные от нуля. 

2. Введены значения собственных обратных связей нейронов («зе-соирНае уе») 
для получения более «плавного» характера убывания значений энергий нейронов при 
удалении от центра активации и устранения нежелательного эффекта попадания ней- 
рона, находящегося на необходимой точке траектории среди большого количества пре- 
пятствий («нулевых» нейронов), в так называемую «потенциальную яму». 

3. В алгоритме реализована возможность динамического изменения весовых ко- 
эффициентов для ускорения процесса входа сети в состояние равновесия в сложной 
конфигурации рабочего пространства. Веса для прямых и собственных связей: уу, = 1хК; 
для диагональных связей: \, = 0,7071хК, где К — динамически меняющийся коэффи- 
циент (К < 5). 

4. Также реализована возможность динамического изменения точности дискрети- 
зации рабочего пространства (размер дискретной ячейки больше или равен габаритам 
робота) для повышения производительности системы при работе в простой конфигу- 
рации рабочего пространства. 

5. Разработан собственный алгоритм поиска максимального градиента по матри- 
це состояний, что позволило увеличить производительность блока конструктора пути 
за счет упрощения формулы расчета градиента и исключения из нее функции Евкли- 
дового расстояния: эта4(а, }) = (Е; — Е;) \, где Е; и Е; — величины активации 1-го и ]-го 
нейронов соответственно; \; — весовой коэффициент связи в направлении от нейро- 
на1к]. 

6. В алгоритм введена система приоритетов и условий для корректного расчета 
траекторий каждого из мобильных роботов с обходом препятствий и избегания столк- 
новений с другими участниками группы: 

— каждому участнику группы присваивается собственное значение приоритета, 
таким образом, при одновременном пересечении расчетных траекторий, траектория ро- 
бота с большим приоритетом остается без изменений, траектория робота с меньшим 
приоритетом корректируется; 

— если приоритеты роботов равны, то их траектории корректируются обоюдно; 

— робот, достигший конечной точки траектории, воспринимается как препятст- 
вие, и будет обходиться другими участниками группы вне зависимости от приоритета; 

— при пересечении траекторий роботов в условиях, при которых невозможна кор- 
ректировка (например, длинный узкий коридор), возможно обратное движение робота 
от заданной конечной точки траектории (с последующим возвращением на данную 
позицию) для свободного прохода участника группы с более высоким приоритетом. 

Приведем общий алгоритм расчета траектории и планирования движений мобиль- 
ных роботов: 1) ввод начальных значений. Вводятся необходимые переменные для 
формирования нейронной карты: текущая позиция агента, позиция цели, расположе- 
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ние препятствий (если есть), также для более гибкого управления коллективом вво- 
дится вектор приоритетности Р = [Р:, Ро, ..., Р‚|, где элементы вектора Р — значения 
приоритета 1-го, 2-го и п-го мобильного робота соответственно; 2) формирование 
нейронных карт (получение матрицы энергии сети) для каждого из агентов; 3) поша- 
говый расчет траектории для каждого мобильного робота с учетом их взаимного рас- 
положения и приоритетов. Примем: Е, Е; — векторы выходных значений энергии ней- 
ронов сети для ]-го и 1-го агентов; Сроз], Сроз1 — текущая позиция ]-го и 1-го роботов 
соответственно; №ро$], М№роз1 — позиция, на которую совершит переход ]-й и 1-й роботы 
соответственно; Тро$], Троз1 — конечная (целевая) позиция ]-го и 1-го роботов соответ- 
ственно; Р} > Р1. Тогда учет расположения и приоритетов выполняется по следующим 
условиям: а) если (Мро$1=Мро5]) или (М№ро$1=Сроз] и Мро5]=Сроз1) в один момент вре- 
мени, то значение нейрона на Мроз1 становится отрицательным (Е(М№роз1)= -Е(М№роз1)) 
и выполняется пересчет шага для 1-го агента; 6) если Мроз]=Троз1, при этом 1-й робот 
уже находится на Троз1 (то есть прошел заданную траекторию), то выполняется пе- 
ресчет шага для ]-го робота (вне зависимости от приоритета). 
Общая блок-схема алгоритма представлена на рис. 3. 


НАЧАЛО 


- номер текущей позиции (СРо5$]); 
- номер целевой позиции (ТРо$]}; 
- начальный вектор состояния сети 
и вектор смешения; 

- вектор приоритета Р: 
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- координаты целевой позиции (ТРоз1): 
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Рисунок 3 — Общая блок-схема алгоритма планирования 
для группы мобильных роботов 
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Результаты моделирования 


Эффективность работы алгоритма была подтверждена математическим модели- 
рованием. Для этого была построена математическая модель предложенной сети из 
100 нейронов в пакете моделирования Ма аБ. Устойчивое состояние сети подавалось 
на вход блока конструктора пути, где производился расчет полной траектории (кон- 
фигурация местности известна и статична) или расчет части траектории (конфигура- 
ция местности меняется и динамична). Непосредственно вычислительные операции 
блока конструктора довольно просты, они формируют некоторую процедуру «вос- 
хождения» к вершине поверхности (цели). Направление на каждом расчетном шаге 
определяется максимальным градиентом по направлению от текущего нейрона 1 до 
соседнего нейрона }. Процесс повторяется для ]-го нейрона и так далее вплоть до того, 
пока не будет найден целевой нейрон и построена конечная траектория. 

Если 1 и } два смежных нейрона, то градиент по направлению от 1 до ] будет при- 
ближенно определяться по формуле: 

тада, }) = (Е; Е) ®;, 
где Е; — величина активации 1-го (текущего) нейрона, Е; — величина активации ]-го ней- 
рона; с; — весовой коэффициент связи в направлении от 1кК ]. 

После выбора максимального градиента и перехода на ]-й нейрон значение энер- 
гии 1-го в матрице активации умножается на —1 (Е, =- Е;). Данная операция проводится 
для того, чтобы избежать возникновения эффекта рысканья и чтобы направления, по 
которым еще не перемещался агент, имели более высокий приоритет. 

Стоит отметить, что при завершении процесса активации значения энергии ней- 
ронов, связанных с нулевыми нейронами (расположенных вблизи препятствий), всегда 
будет ниже, чем значение нейронов, связанных с ненулевыми. Данный эффект являет- 
ся своеобразной «ближней предусмотрительностью» агента, что предполагает плавный 
обход препятствий. 

В случае, если цель недостижима (агент окружен препятствиями), значение ней- 
рона-агента будет равно 0, а также все нейроны, находящиеся в окружении, будут на- 
ходиться в нулевом состоянии, так как волна распространения от нейрона-цели не будет 
доходить до них через препятствия. Это условие проверяется в самом начале алгорит- 
ма и, если оно выполняется, то блок конструктора пути будет выдавать сообщение о 
невозможности расчета траектории. 

Для группы мобильных роботов расчет траектории и позиционирование выпол- 
няются в следующем порядке: 

— ввод начальных значений. Вводятся необходимые переменные для формирова- 
ния нейронной карты: текущая позиция агента, позиция цели, расположение препят- 
ствий (если есть), также для более гибкого управления коллективом вводится вектор 
приоритетности Р = [Р.,Р», ..., Р.|, где элементы вектора Р — значения приоритета 1-го, 
2-го и п-го мобильного робота соответственно; 

— формирование нейронных карт (получение матрицы энергии сети) для каждо- 
го из агентов; 

— пошаговый расчет траектории с привязкой ко времени для каждого мобильного 
робота с учетом их взаимного расположения и приоритетов. 

Введем следующие условные обозначения: 

Р = [Р1, Р2, РЗ] - вектор приоритета; 

фагоее 1, 2, 3 — номера позиции целей 1-го, 2-го и 3-го роботов соответственно; 

баг 1, 2, 3 — номера начальных (текущих) позиций 1-го, 2-го и 3-го роботов; 

0651 — вектор, элементы которого — это номера расположения препятствий, если 065 = 0, 
то препятствия не установлены. 
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Выходные переменные: 
уерз 1, 2, 3 — количество времени, затраченное 1-м, 2-м или 3-им роботом на прохож- 


дение траектории; 


М асепЕ %ер — момент времени пересечения М-м роботом траектории другого робота; 
сто55ше т_п- позиция одновременного пересечения траекторий робота т и робота п; 
сиигепЕ роз оп — текущая позиция М-робота; 

Результаты моделирования представлены на рис. 4 и 5. Окружностями обозначе- 
ны вероятностные точки пересечения траекторий. 


\М/окзрасе сопйдиганой Ра са!сшаноп 


0 
О 2 


О 
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Рисунок 4 — Результаты моделирования при пересечении траекторий 


трех мобильных роботов 


\откзрасе сопйдигаНоп Ра! са!сМаНоп 


Рисунок 5 — Результаты моделирования при встречном пересечении траекторий 


1-го и 2-го роботов 


Входные и выходные переменные результатов моделирования, представленных 
на рис. 4, определены следующими значениями: 


1атее  =26 
$агИ =1 
1атее!2 =49 
$1а72 =41 
1агее!3 =16 
$1а7т3 =96 
Р= [3, 2, 1] 


Зт4 авет чер: %4ерз3 = 5 
сто5зте 3-2: 46 

сигтет ро5оп: 56 

Зт4 авет чер: %ерз3 = 6 
сто5зте 3-2: 47 

сигтет ро5оп: 56 

Зт4 авет чер: %ерз3 = 9 
стоузте 3-1: 26 

сиггет ро5оп: 35 

$ер$1 =5 $ер$2 =8 $4ерз$3 = 11 
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Входные и выходные переменные результатов моделирования, представленных 
на рис. 5, определены следующими значениями: 


ге =100 571 =12 274 азет 5ер: %еру2 =4 
гагве!2 =| — $14712 =89 стоззте 2-1: 45 сигтет розоп: 56 
гагзе13 =51 5173 =96 5еру1 =8 еру2 =10 51ер53 =5 


Как видно из полученных в ходе моделирования результатов, для достижения 
бесконфликтного движения в соответствии с предложенным мультиагентным алгоритмом 
планирования, роботы не только своевременно изменяют маршруты своего движения 
(траектории 1-го и 2-го роботов на рис. 5), но и осуществляют изменение скорости свое- 
го движения (траектория 2-го робота на рис. 4). Стоит отметить, что при завершении 
процесса активации значения энергии нейронов, связанных с нулевыми нейронами 
(расположенных вблизи препятствий), всегда будет ниже, чем значение нейронов, 
связанных с ненулевыми. Данный эффект является своеобразной «ближней предусмот- 
рительностью» агента, что предполагает плавный обход статических и динамических 
препятствий. 

В дальнейшем планируется разработка аппаратной поддержки централизованной 
системы управления на базе стационарных вычислительных комплексов с использова- 
нием нейроускорителей, а также разработка распределенной децентрализованной сис- 
темы с учетом аппаратной специфики бортовых комплексов. 
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О.В. Дартнцев, А.Б. М1гранов, Б.С. ЮФнцев 

Нейромережний алгоритм планування траекторий для групи моб! льних робот!в 

Розглядаються питання побудови 1нтелектуально! системи планування траекторий руху для групи мобйльних 
роботив на баз! рекурентно! нейронно! мереж!. Планування реал!зоване за г1бридним принципом 1 полягае 
в побудов! загального блоку конструктора дороги для формування траекторий учасниюв групи в робочому 
простор! 1 використанн! розподлено] рекурентно] нейронно! мереж! для формування нейронно] карти 
з врахуванням шльових позишй кожного з мобльних роботив. 


О.Т. Ратптбеу, А.В. М1ртапоуъ, В.5. Уитсеу 

Меига! МебуогКк Дог т о? Р!аппшо Тга]есюне$ ог а Сгоир о Моше ВоБо5 

ТБе адиезНоп$ оЁ рапиш и\еШесвла! зу$ет сопзиасНоп, ус аге Базе оп а гесиитеп{ пеига! пебмогК, Юг 
тобе гобо6 этопр галесюпез аге сопз14егед. Р!аппте ргоседиге 15 геаПте4 Ъу а Вубиа рипсре ап соп$155 
оЁ Ше оепега1 Боск оЁ Ве ра 4ез1етег, УЛисВ са1сшаез (Юплз) гадесюпез Юг этоир рагастращ$ ш у’огКте 
зрасе апа Ве изазе оЁ Фе Чит ше4 гесиггепе пеига| пебмогК Юг 4е51епе а пеига] сага {аК те шю ассоип 
{агое{ роз!1оп$ оРеасВ тоб!е гофо!. 


Статья поступила в редакцию 23.12.2010. 
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